发布古籍整理数字资源45亿字规模 最大线上整理本古籍资源库成立十周年
本报北京10月26日电(记者陈雪)日前,发布中华书局古联公司成立十周年暨古籍智能化建设与应用高端论坛在京举行,古籍规模来自全国高等院校、整理资源最大整理周年图书馆、数字出版机构的亿字源库百余位专家学者出席。会上介绍了古籍数字化的线上多项成果,目前古联公司发布的本古数据库产品资源规模已达45亿字,构成国内规模最大的籍资线上整理本古籍资源库。
据介绍,成立十年来,发布古联古籍数字化产品矩阵以专业整理本古籍为核心,古籍规模同时陆续推出了“中华石刻数据库”“历代进士登科数据库”“木版年画数据库”“殷墟甲骨文数据库”“小学文献数据库”等专题数据库,整理资源最大整理周年共涵盖专业古籍整理出版资源27.5亿字,数字学术资源2.8亿字,亿字源库普及资源3亿字,线上石刻文献7万余篇,文史工具资源150余万条,历代登科人物10万余条,甲骨文卜辞14万余条,木版年画18000余幅,书法作品10000余种,其他专题性典籍资源3亿字,资源类型与规模均居行业首位,为用户提供了高质量的内容和丰富的选择空间。此外,古联公司还发布有近代报刊文献资源7.4亿字,口述史视频1300分钟,档案60000余幅,为近现代研究提供了有效支持。古联公司古籍大数据中心对上述数据资源均进行了精细化加工与结构化标引,并基于机器深度学习技术推出古籍智能整理平台,实现了文字录入、断句标点、繁简转换、专名识别、文白翻译全流程自动化,将古籍出版从“人工点校”升级至“人机协同”新阶段。
中华书局总经理助理、古联公司总经理洪涛说,以前的“古联”代表着汇聚古籍资源的“古籍联合”,未来的“古联”要实现“聚古联今”,让古籍内容融合现代生活。
未经允许不得转载:>凄风寒雨网 » 发布古籍整理数字资源45亿字规模 最大线上整理本古籍资源库成立十周年
凄风寒雨网



